iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 3
1
AI & Data

Hello Tableau, again系列 第 3

D3: Data Start -1(非結構化與結構化資料)

  • 分享至 

  • xImage
  •  

昨天跟分享了BI的概念
有沒有覺得 哀阿! 好像是一個可以用的東西XD
可是在我們要先可以開始work之前
我們需要我們的原始可分析資料
就像你要煮飯一定要米阿
不然是煮一個身體健康?

那我們要怎麼獲得米

去全聯買阿

這就要來說一下什麼叫做可以被分析的資料

非結構化資料 (unstructured data) vs. 結構化資料 (structured data)
簡單來說
平常大家在使用的
都是經過前人用心用肝用汗水整理好敲了資料
我們才拿來使用

非結構化資料
簡單來說只要沒有規則的可被蒐集的東西就算非結構化資料

影片 音樂 書本內容 ...等
沒有可以將資料歸到欄位分類的就算非結構化

結構化資料
蒐集的資料整齊每一筆都有相同了欄位劃分或是資料格式

像是影片分類:恐怖片 音樂分類:搖滾樂 書本內容:財經相關
可以訂定規則被分類的那種就是結構化資料

那簡單在用一個實際範例說明一下到底要怎麼區分吧

小明每天都寫日記

又是小明

今天是9/19的日記
早餐吃了50塊,可惡早餐店的阿姨漢堡居然沒幫我放肉片
然後就開始上班是個正常的一天
午餐很寒酸吃了20塊的滷肉飯

大家真的要好好防堵非洲豬瘟
不然就沒有滷肉飯吃了

晚餐很榮幸有人請我吃烤肉沒花半毛錢
我就帶著愉快的心情入睡

↑這種東西就是非結構化資料

↓結構化資料會長這樣

| Date | 餐 | 吃什麼 | 多少摳摳 |
|---|---|---|---|---|
| 9/19 | 早 | 漢堡 | 50 |
| 9/19 | 午 | 滷肉飯 | 20 |
| 9/19 | 晚 | 烤肉 | 0 |

差異大概是長這樣
希望有解釋清楚 XD
明天見囉

-- 文章歡迎轉載但請註明出處 --


上一篇
D2: BI Start
下一篇
D4: Data Start -2(資料屬性&資料型態)
系列文
Hello Tableau, again30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言